Regresión lineal y series de tiempo Gerardo 


Actividad 1. Conseguir datos de la forma (11, Yy1), ..., (Tn, Yn). Re- 
alizar con ellos un diagrama de disperción, así como trazar una recta 
| que pase por dos puntos (x;,y;), (15, y¿) y calcular los residuales 
ex = Y; — Uzy) para cada k = l,...,n. 


Actividad 2. Ajustar una recta a los datos usando el método de 
mínimos cuadrados. Calcular los residuales correspondientes. 


Actividad 3. Calcular la parábola que se ajusta a los datos usando el 
método de mínimos cuadrados. Calcualar los residuales correspondi- 
entes. 


Solución. 
Se consiguieron datos de valores diarios del índice bursátil SP42500 


y precios al cierre de cada día de acciones de Amazon en el periodo 
comprendido del 05/02/2024 al 05/03/2024. 


En este caso, los valores del SP4500 dispusieron en el eje x y los 
precios de Amazon en el eje y y se realizó el gráfico de dispersión de 
la Figura 1. 


Después, se escogieron los puntos 
(5.13, 178.22), (4.95, 168.64) 


y se calculó la pendiente y la ordenada al origen de la recta l¡ que 
pasa por ellos. La ecuación de dicha recta es 


(a) = 52.08% — 89.36 


y su gráfica es la línea negra en la Figura 1. 


1 des] 


La gráfica de dispersión de los valores del SP£2500 y de los residuales 
e =y-— l(x) así como el histograma de los mismos se encuentran en 


la Figura 2. Se observa en el diagrama de dispersión que los puntos 


(x, e) no parecen tener un patrón, si no que se encuentran dispersos 
alrededor del eje x. Por otro lado, el histograma de los residuales 


parece indicar que estos tienen una distribución gamma. 


Figure 1: 
roja se obtuvo a través de la selección arbitraria de dos puntos y la negra por medio de mínimos cuadrados. 
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Gráfico de dispersión de los valores del SPé£2500 y los precios de las acciones de Amazon. La línea 
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Figure 2: Residuales e = y — l1(x) 


2 dels] 


La recta l2 obtenida por mínimos cuadrados tiene como pendiente 
61 = 2 dvi — li 4) Dl 0 49.41 
2 (xi 1) 


y ordenada al origen 


Bo =U-— $13 = 76.49 


la obtención de dichos valores se encuentra en el apéndice de este 
trabajo. Su gráfica es la línea roja en la Figura 1. El gráfico de 
dispersión de los residuales e! = y; — la(1), así como su histograma 
se presentan en la Figura 3. 


Al igual que con la recta obtenida con la selección de dos puntos ar- 
bitrarios, la recta obtenida con mínimos cuadrados genera residuales 
cuyo gráfico de dispersión permite ver que no hay un patrón entre 
ellos. Además, sus el histograma de estos residuales permite ver que 
estos tienen una distribución muy parecida a la normal estándar. 


Gráfico de dispersión de residuales Histograma de residuales 
o o 
O PP... 
o 
E o 
El o ¿2 Ñ id 9 
Ys] O — o 
Y 
o o 
.= o AS 
o 
Q Y 
o 
4.95 5.00 3:09 5.10 
-3 2 1 0 1 z 3 
sp500 


Figure 3: Residuales e! = y — l2(x) 


3 des] 


Por último, ajustamos una parábola 


p(x) = a + ba + ex? 


a los datos, cuyos coeficientes se encuentran aplicando el método 
de mínimos cuadrados - la explicación detallada se encuentra en el 
apéndice. 

Los coeficientes para estos datos son 


a =845.76859, b=-—1507.8939 y c=154.5605, 


y su gráfica es la siguiente 
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Figure 4: Parábola ajustada a los datos por mínimos cuadrados 
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Figure 5: Residuales e* = y — p(x) 
Apéndice 


Calcular la recta que se ajusta a los datos por mínimos 
cuadrados 


Suponga que tiene n parejas de números reales (11, Y), ..., (Tp, Yn). 
Se desea encontrar el argumento (6%, 67) que minimiza la siguiente 


función 
n 


$ (Bo, B1) = Y (ui — (Bo + Brx5)Y. 
¡=1 
Por el Critero de la Primer Derivada para encontrar puntos críticos, 


(64, 61) debe satisfacer que 
z KA 
0 


77165, 81) =0, 


5 dels] 


Calculando dichas derivadas, tenemos que 


Y Y — (87 + Pix:) =0 
i=1 


S y — Bo + Bjx;)x;=0 (1) 
¡=1 
Despejando Pj¿, tenemos que 


Y y=n8- PB) 0 =0 
i=1 i=1 


Bo =Y-— BZ. 


Ahora, reemplazando maipulando la expresión (1), 


n n n 
Y yiz; By 2, = Bd el =0 
i=1 En ¡=1 


Reemplazando 6, en dicha expresión, 


Y yt; a ys = Bi xi al 
i=1 ¡=1 ¡=1 


Despejando Pf, 
Y)_Z¡— > YiT; 


Bj = 2 E 
E 5 


Ahora, observemos que como > (y; — Y) = ny — ny =0 
yy 2, ER Y yiz; Y yiz; — YyZ; 2) ( Yi — 
1) lí 
=) (y —Dlr—3) 


6 des] 


Por otra parte, 


Y a; — y = Y a = NE; 
E ni; = 0, 
= Sy 1 —2n3+n2; 
= > ri — a +nE 
= S (z, = a”, 
Así obtenemos una expresión equivalente para Bj, 


AI 
Aa 


Agregando nx; 


Bi = 


Observe que 


Feoñ0 (Po, P1) =2 
f8051 (80, 81) =2 
6,8160, P1) E 2) x, 


Peamno Feos 00, Bi) > Uy $808, (80, BI) —F 8080 (65, BDO Fs (80, Bi) 5 
0,por el Criterio de la Segunda Derivada para funciones de dos vari- 
ables, los betas encontrados son un mínimo local. 


Calcular la parábola que se ajusta a los datos por mínimos 
cuadrados 

En este caso, se quiere encontrar una terna de números reales (a*, b*, c*) 
que minimizan la función 


7 des] 


n 


g(a,b,c) = S (y — (a+ bx; + cx?) y 
¡=1 
Dicha terna, por el Criterio de la Primer Derivada satisface que 


10) 10) 10) 

cd —ala* b* c*) = —gla”. 0.0) =0. 
a), gay, )=0 y 3 gla”,b”,c”) 
Calculando dichas derivadas, tenemos que 


n 


S (y — (at + btx, + cta) =0 


¡=1 
Sy zily; — [at + bx, + c*x7)) =0 
¡=1 
Sy xy — [a* + bx, + c*x7)) =0 
¡=1 


Expandiendo las ecuaciones de arriba, tenemos 
Y y = an EY ato) aa 
Y uy = ad a +0) el +ed aj 
Y Y _ ay + y 2 od a: 


Se debe resolver dicho sistema de ecuaciones para encontrar los coe- 


ficientes de la parábola de mínimos cuadrados. 


8 des] 


